Alzheimer’s & Dementia:基于海马MRI影像的AD早期预测的深度学习模型
A deep learning model for early prediction of Alzheimer’s disease dementia based on hippocampal magnetic resonance imaging data. Alzheimer’s & Dementia 2019; 15:1059-1070.
【摘要】
预测轻度认知障碍(MCI)患者何时转化为阿尔茨海默病(AD),具有很大的临床意义。作者提出并验证了一种基于MRI深度学习的方法,通过对2146名受试者(803名训练集,1343名测试集)的MRI扫描来预测MCI被试的进展结果,深度学习模型可以通过个体影像信息预测发展为AD的时间。数据来自阿尔茨海默病神经影像计划(ADNI)的439例测试样本,结果一致性为0.76, 并且对MCI受试者进行6 - 78个月随访;对40例澳大利亚影像计划(AIBL)测试样本诊断的一致性指数为0.781,对MCI受试者的随访时间为18 - 54个月。作者采用了深度学习方法对患者疾病进程进行了预测,结果一致性指数为0.864,为了提升预测准确性,作者还将基因风险与基线临床测量信息添加到最终模型。本文的方法为潜在的患病预测提供了一种经济有效且准确的方法,不仅可以对MCI类型进行划分还能预测进展型MCI的发病时间。
关键词: 深度学习;海马;时间-事件分析;阿尔茨海默病
【前言】
虽然临床上对MCI和AD的发展进程划分了评估标准,但在基线处仍难以预测何时以及哪些MCI患者最终会发展为AD。现有的分类研究一般采用相对简单的影像学测量,如脑组织密度、体积、皮层厚度、海马的几何特征等。重要的是,基于分类的AD早期预测并没有提供MCI患者将在何时转化为AD。最近的研究已经将重点转移到使用深度学习技术来预测随访期间AD痴呆进展的时间。为了更好地预测个体MCI的进展,基于结构磁共振成像(MRI)的数据,开发了一个深度学习框架来提取海马的特征信息,并根据提取的特征建立预测模型,以预测MCI受试者发展为AD的具体时间。作者使用来自ADNI的受试者的结构MRI数据评估了所提出的方法(包括ADNI-1, ADNI-GO&2)和 AIBL构建并验证了模型。
【方法】
1被试影像和临床数据
作者使用了多中心脑影像数据,包括1711名ADNI受试者和435名AIBL受试者的T1结构MRI扫描。使用来自ADNI-1的803例MRI数据——训练提出的预测模型。在此基础上,利用独立数据集对模型进行了验证,独立数据集包含ADNI-GO&2和AIBL。对于ADNI-GO队列,仅使用新增加的受试者(不与ADNI-1重叠)进行验证。(本研究使用1.5T采集ADNI-1数据,使用3T采集ADNI-GO和ADNI-2、AIBL数据)。
临床信息包括:年龄、性别、教育程度、风险基因型(APOE4)、阿尔茨海默病评估量表的认知亚量表(ADAS-Cog13) 、听觉言语学习测试(RAVLT)、功能评估问卷(FAQ)和认知量表评分(MMSE)
2 海马提取
使用仿射配准将个体T1结构MRI影像投射到标准空间,以1x1x1mm的空间分辨率对数据重新采样。
利用the local label learning algorithm从T1图像中分割出每个受试者双侧的海马区域,使用大小为29x21x55的3D patch作为模型输入,
然后the segmentation labels从T1图像中提取海马区域,这些海马数据被用来提取特征和建立预测模型。
3 深度学习用于信息特征提取
通过训练卷积神经网络(CNN)来区分AD和NC的信息特征。如图1B所示,左侧和右侧海马图像分别作为两组数据流输入到深度学习模型中,每组数据流对应一个海马区域。
深度学习模型的标准流程:1个卷积层、3个残差块层、1个全局平均池(GAP)层组成。如图1C所示,每个残差块都有2个卷积层,分别在输入和输出之间有直接连接的,然后将这两个数据流的输出作为输入连接到一个全连接层,以构建分类模型。模型使用校正后的线性单元作为非线性激活函数,采用最大池化层进行多尺度特征学习。深度学习模型采用批量归一化,GAP层通过类似于AD的相关映射进行特征的可视化。模型使用2x2x2大小、步长为2的滤波器对数据进行卷积操作,并进行比例为0.5的dropout操作,最终由256个特征输入到全连接层,对输入数据进行诊断。
图1基于深度学习的AD预测模型框架示意图
(A)表示训练和验证预测模型的一般流程图;(B)表示基于海马数据驱动的AD诊断的深度网络架构;(C)表示残差块结构
4 基于深度成像特征的事件时间预测模型
基于深度学习的特征,使用the LASSO regularized Cox regression model建立了预测个体受试者发展为AD痴呆的时间预测模型。预测模型根据ADNI-1队列进行训练,并根据ADNI-GO&2和AIBL数据进行验证。总体训练和测试框架如图1A所示,利用训练数据进行了10次交叉验证,并且优化了LASSO模型的正则化参数,预测模型用于评估个体进展为AD的风险评分。风险得分较高的个体比风险得分较低的个体更早发展为AD,进展为AD痴呆的概率值也就更高。
5 结合临床变量信息—构建深度学习的事件时间预测模型
基于深度学习的预测模型,可以评估每个MCI受试者进展为AD痴呆的风险。将评估的风险与临床变量相结合,(包括年龄、性别、教育、APOE4、ADAS-Cog13、RAVLT、和MMSE)来建立第二个预测模型。第二个预测模型采用LASSO模型的Cox回归。基于ADNI-1的MCI受试者训练预测模型,并基于ADNI-GO&2数据进行评估。因为AIBL没有提供以上所有临床信息,因此没有对AIBL数据的预测模型进行评估。
6 验证和比较
对提出的方法进行了评估,并将其与基于相同训练和测试的数据集与目前最先进的图像特征提取方法进行了比较。所有模型均使用ADNI-1数据进行训练,并使用ADNI-GO&2和AIBL数据进行验证。将深度学习模型与建立在传统提取海马成像特征的模型进行了比较,(包括形状特征和纹理特征)。
为了评价深度学习对影像特征的鉴别能力,基于常规海马形状和纹理特征,采用不同的分类模型,与采用随机森林对常规特征建立分类的模型进行了比较。本文的模型具有更好的分类性能。在此以分类准确性(ACC),工作特性(ROC)曲线下面积(AUC)作为性能评估的指标。为了研究海马成像数据的不同部分对分类的影响,从测试数据中获得了所有受试者与AD疾病的相关图谱,以及不同组别受试者组(包括NC、sMCI、pMCI和)的平均图谱。
从基线扫描开始的0.5到3年,MCI发展为AD痴呆的受试者——被定义为进展性MCI(pMCI),时间均值为0.93年,否则定义为稳定性MCI(sMCI)。作者进一步研究了海马成像特征与临床测量之间的关系,包括MMSE、ADAS-Cog13、RAVLT immediate、RAVLT,APOE4基因型等信息。本文采用皮尔逊相关系数来看关联,基于不同影像学特征、用C-index建立预测模型的ROC曲线评价其准确性。C-index用以评估所有可能的MCI发展到AD痴呆的概率,此外作者对淀粉样蛋白阳性的MCI患者的预测准确性也进行了评估,所有评估测量均以相关系数R来计算。
分析了MCI发展为AD痴呆的预测风险的分级统计结果。具体来说,所有的MCI受试者被分为3个亚组,分别有低、中、高发展为AD痴呆的预测风险,并采用Kaplan-Meier显示其发展为AD的进程。
【结果】
针对113例1.5T和3T 扫描的ADNI-1被试进行交叉验证表明深度学习特征的相关性均值为0.9550.023,深度学习特征的类内相关系数均值为0.950±0.026,说明深度学习特征对磁场强度差异具有很强的稳定性。1.5T和3T扫描的被试预测风险评分的类内相关系数为0.982,表明用于识别的深度学习分类器具有较高准确率。使用独立样本集对ADNI-GO&2和AIBL组进行预测,结果相关性分别为0.900和0.929, AUC值分别为0.956和0.958。试验表明,深度学习分类器在AUC值上明显优于随机森林分类器。
图2为不同组别AD特征的关联图,从左到右分别为NC、sMCI、pMCI和AD患者的ADNI-GO&2组平均图谱。结果发现,AD被试的相关图谱突出了海马前侧和海马后侧,pMCI受试者突出了海马前侧,NC和sMCI受试者的相关图谱分布相对较弱。从图3可以看出,前 50个深度学习特征的贡献权重,在ADNI-GO&2组所有受试者的深度学习分类器中、认知测量和生物标志物中权重贡献最大,表明深度学习特征与临床测量显著相关。
图2 不同被试组别对AD特征响应的平均相关图
如图2显示了区分AD和NC受试者的识别亚区,并描述了AD病人进展的影像学模式。
较暖的颜色表明大脑退化更严重,与病情进展更相关
冷色表示脑退化程度较低,与AD的进展无关。
图3 AD/NC诊断深度分类模型中权重最大的前50个特征与临床认知相关
图3的箱形图表明了认知和临床测量方法与前50个深度学习特征之间的相关系数。这些结果表明,深层影像特征对获取与ad相关的生物标志物和认知测量具有信息性。
表1总结了基于海马成像特征建立的预测模型的预测准确性。深度学习模型预测ADNI-GO&2 MCI受试者进展为AD痴呆的风险得分,C-index指数为0.762,明显优于那些建立在传统机器学习上模型。结果显示,基于深度学习特征预测AD痴呆进展风险和临床测量建立的预测模型可以获得更好的效果。
表1 建立在不同类型特征上的预测模型的预测性能
如图4所示AUC通过深度学习模型获得的随访时间在1 ~ 3年分别为0.75、0.778、0.813;ADNI-GO&2组优于其他模型。与基于形状特征的预测模型和基于形状、形状和纹理特征的预测模型相比,差异显著。
基于深度学习成像特征的预测模型预测淀粉样蛋白阳性受试者发展为AD痴呆风险,C-index为0.733,优于基于常规形状和形状与纹理成像特征的预测模型。基于深度学习特征预测AD痴呆进展风险和基线临床测量建立的预测模型取得了更好的效果,C-index =0.864;
在ADNI-GO&2组中,明显好于仅基于临床测量建立的模型,C-index 5=0.848。
进一步估计了建立在不同临床测量组合上的预测模型的性能,结果表明影像特征和人口统计学指标的预测效果显著优于MMSE和人口统计学指标的组合。在认知测量方面,ADAS-Cog13结合人口学测量预测效果最好,而深度学习成像特征与ADAS-Cog13结合人口学数据预测效果差异无统计学意义(P =0 .257)。深度学习使用影像结合基因型特征和影像结合淀粉蛋白特征得出的结果具有较高一致性。
图4 ADNI-GO&2组患者随访1年至3年不同影像学特征的预测发病时间模型的ROC曲线
图5 深度学习预测模型不同进展风险的MCI亚组的Kaplan-Meier图
对ADNI-GO&2组的MCI受试者进行测试,结果表明不同患病风险组别在转化为AD痴呆的时间上存在显著差异(Log-rank检验,P<.0002)。
【讨论】
本文提出了一个基于海马区域的AD痴呆早期预测的深度学习框架,训练了基于ADNI-1数据的深度学习分类器来提取影像信息特征,并根据这些特征建立了时间-事件预测模型来预测AD痴呆的发展。模型结果证明深度学习预测模型在预测MCI患者发展为AD痴呆的时间和识别不同pMCI的患者亚组方面有很好的效果。深度学习模型可用于预测AD进展风险(基于ADNI数据收集的MRI个体数据)。整个预测流程是全自动的,且模型对于海马体分割不敏感。一旦得到训练好的模型,深度学习特征提取和预测在各个单元都是有效的。特别是,对于每个主题,在预测单元上大约需要0.011秒。这为临床医生提供了一种直接和快速的方法—对MCI患者在特定时间段内发展为AD的可能性进行分级。这证明了AD痴呆早期预测的深度学习方法可以取得良好的效果,有助于区分不同进展模式的MCI患者,识别出发展风险较高的MCI患者。
编辑、审阅:齐志伟、王瑜
原文链接:
https://doi.org/10.1016/j.jalz.2019.02.007
结构磁共振(sMRI)数据处理 弥散磁共振(dMRI)数据处理 静息态功能磁共振(rs-fMRI)数据处理 任务态功能磁共振(task-fMRI)数据处理 小动物磁共振数据处理 脑电、脑磁图(EEG/MEG)数据处理 近红外成像(fNIRS)数据处理 动脉自旋标记(ASL)数据处理 正电子断层成像(PET)数据处理
详情联系:13381109780(杨老师)